1 Introdução
Após 16 dias de competição, os Jogos Olímpicos de Inverno, Pequim 2022, estão chegando ao fim.
2 Importação dos dados
Os dados que serão utilizados neste trabalho foram retirados do site Kaggle, e contemplam as Olímpiadas de Inverno e Verão, da Era Moderna, entre os anos de 1896 e 2016.
olimpiadas <-
readr::read_csv(
here::here("dados", "olympics-1896-2016.csv"),
col_types = readr::cols(
ano = readr::col_integer(),
edicao = readr::col_factor(levels = c("Summer", "Winter")),
id_atleta = readr::col_character(),
sexo = readr::col_factor(levels = c("M", "F")),
idade = readr::col_integer(),
altura = readr::col_double(),
peso = readr::col_double(),
medalha = readr::col_factor(levels = c("Gold", "Silver", "Bronze"))
)
) |>
janitor::clean_names()
3 NÚMERO DE ATLETAS, NAÇÕES E MODALIDADES AO LONGO DOS ANOS
3.1 Número de atletas
olimpiadas |>
dplyr::filter(esporte != "Art Competitions") |>
dplyr::group_by(ano, edicao) |>
dplyr::summarise(atletas = length(unique(id_atleta))) |>
dplyr::ungroup() |>
ggplot2::ggplot() +
ggplot2::aes(
x = ano,
y = atletas,
group = edicao,
color = edicao
) +
ggplot2::geom_line(show.legend = FALSE) +
ggplot2::geom_point(show.legend = FALSE) +
ggplot2::scale_color_manual(values = c("darkorange", "darkblue")) +
ggplot2::annotate(
"text",
x = c(1916, 1940),
y = c(4500, 7500),
label = c("1a GM", "2a GM")
) +
ggplot2::annotate(
"text",
x = c(2006, 2010),
y = c(9000, 5000),
label = c("Verão", "Inverno")
) +
ggplot2::geom_curve(
ggplot2::aes(
x = 1913,
y = 4000,
xend = 1916,
yend = 3000,
),
size = 1,
arrow = ggplot2::arrow(length = ggplot2::unit(0.02, "npc")),
color = "black",
show.legend = FALSE
) +
ggplot2::geom_curve(
ggplot2::aes(
x = 1940,
y = 7200,
xend = 1940,
yend = 4500
),
size = 1,
curvature = 0.2,
arrow = ggplot2::arrow(length = ggplot2::unit(0.02, "npc")),
color = "black",
show.legend = FALSE
) +
ggplot2::scale_x_continuous(limits = c(1896, 2016),
breaks = seq(1896, 2016, 10)) +
ggplot2::scale_y_continuous(limits = c(0, 12000),
breaks = seq(0, 12000, 1500)) +
ggplot2::labs(
title = "Número de atletas que competiram em cada Olimpíada",
caption = "Elaboração própria (2021)",
x = "Anos",
y = "Atletas"
) +
ggplot2::theme_minimal()
3.2 Número de países
olimpiadas |>
dplyr::filter(esporte != "Art Competitions") |>
dplyr::group_by(ano, edicao) |>
dplyr::summarise(equipes = length(unique(delegacao))) |>
dplyr::ungroup() |>
ggplot2::ggplot() +
ggplot2::aes(
x = ano,
y = equipes,
group = edicao,
color = edicao
) +
ggplot2::geom_line(show.legend = FALSE) +
ggplot2::geom_point(show.legend = FALSE) +
ggplot2::scale_color_manual(values = c("darkorange", "darkblue")) +
ggplot2::annotate(
"text",
x = c(2006, 2010),
y = c(160, 50),
label = c("Verão", "Inverno")
) +
ggplot2::scale_x_continuous(limits = c(1896, 2016),
breaks = seq(1896, 2016, 10)) +
ggplot2::scale_y_continuous(limits = c(0, 250),
breaks = seq(0, 250, 50)) +
ggplot2::labs(
title = "Número de países participantes em cada Olimpíada",
caption = "Elaboração própria (2021)",
x = "Anos",
y = "Países"
) +
ggplot2::theme_minimal()
3.3 Número de modalidades
olimpiadas |>
dplyr::filter(esporte != "Art Competitions") |>
dplyr::group_by(ano, edicao) |>
dplyr::summarise(modalidades = length(unique(evento))) |>
dplyr::ungroup() |>
ggplot2::ggplot() +
ggplot2::aes(
x = ano,
y = modalidades,
group = edicao,
color = edicao
) +
ggplot2::geom_line(show.legend = FALSE) +
ggplot2::geom_point(show.legend = FALSE) +
ggplot2::geom_point(show.legend = FALSE) +
ggplot2::scale_color_manual(values = c("darkorange", "darkblue")) +
ggplot2::annotate(
"text",
x = c(2006, 2010),
y = c(300, 150),
label = c("Verão", "Inverno")
) +
ggplot2::scale_x_continuous(limits = c(1896, 2016),
breaks = seq(1896, 2016, 10)) +
ggplot2::scale_y_continuous(limits = c(0, 300),
breaks = seq(0, 300, 50)) +
ggplot2::labs(
title = "Número de modalidades esportivas em cada Olimpíada",
caption = "Elaboração própria (2021)",
x = "Anos",
y = "Modalidades"
) +
ggplot2::theme_minimal()
4 As mulheres nas Olimpíadas
4.1 Número de homens e mulheres ao longo do tempo
data <- olimpiadas |>
dplyr::filter(esporte != "Art Competitions")
original <- c(1994, 1998, 2002, 2006, 2010, 2014)
novo <- c(1996, 2000, 2004, 2008, 2012, 2016)
for (i in 1:length(original)) {
data$ano <- gsub(original[i], novo[i], data$ano)
}
data$ano <- as.integer(data$ano)
data |>
dplyr::group_by(ano, sexo) |>
dplyr::summarise(atletas = length(unique(id_atleta))) |>
dplyr::ungroup() |>
ggplot2::ggplot() +
ggplot2::aes(
x = ano,
y = atletas,
group = sexo,
color = sexo
) +
ggplot2::geom_line(show.legend = FALSE) +
ggplot2::geom_point(show.legend = FALSE) +
ggplot2::scale_color_manual(values = c("darkblue", "red")) +
ggplot2::annotate(
"text",
x = c(2013, 2013),
y = c(9000, 4800),
label = c("Homens" , "Mulheres")
) +
ggplot2::scale_x_continuous(limits = c(1896, 2016),
breaks = seq(1896, 2016, 10)) +
ggplot2::scale_y_continuous(limits = c(0, 10000),
breaks = seq(0, 10000, 2000)) +
ggplot2::labs(
title = "Número de homens e mulheres ao longo do tempo",
caption = "Elaboração própria (2021)",
x = "Anos",
y = "Atletas"
) +
ggplot2::theme_minimal()